Maximum Likelihood
어떤 평균값을 갖는 확률밀도로 부터 이 샘플들이 추출되었을까?
https://angeloyeo.github.io/2020/07/17/MLE.html
이 샘플링 된 값들은 어떤 확률 분포에서 추출되었을 가능성이 높을까?
Likelihood Function (수학적 표현)
여기서
그니깐 주어진
Log-Likelihood
주로 로그를 씌워서 likelihood를 표현한다.
주목할 점은, log를 씌움으로써
Negative Log-likelihodd
위의 log likelihood에 음수를 취한 값. 그러면 최대화가 아닌 최소화 문제가 되기 때문에, loss에서 이 negative log likelihood를 최소화하는 방향으로 학습이 진행된다.